查看原文
其他

OceanBase谈产品战略思考:持续践行“一体化”

CSDN CSDN 2023-12-12
毋庸置疑,我们正在处在一个数据量爆炸的时代。

从数字化、信息化再到数智化,海量数据持续增长,由此带来的高并发问题层出不穷。事实上,这种数据增长态势并非近年来才出现,从上世纪90年代互联网的兴起,到本世纪初线上交易系统迅猛发展,数据量不断增大、数据类型复杂多样,集中式数据库力有不逮,各类非关系型数据库持续涌现。企业面对不同的场景需要不同的数据库,数据库数量持续增加,数据使用和管理越发复杂,因此一体化数据库的发展就变得愈发重要。

11月16日,在OceanBase2023年度发布会上,OceanBase CEO杨冰宣布,OceanBase将持续践行“一体化”产品战略,为关键业务负载打造分布式数据库。同时在会上,OceanBase 发布一体化数据库的首个长期支持版本OceanBase 4.2.1 LTS,为开发者和企业提供更为完善的数据库服务。
关山难越,OceanBase 从头越

13年前,中国移动互联网爆发式增长,带来前所未有的海量数据以及数据高并发,如何应对眼前棘手难题,摆在 OceanBase 面前两个选择:开源、自研。选择开源之路无疑是站在前人肩膀做创新,但到了企业需求的深水区,无法绕过数据库分布式的复杂度,要么被数据库消化掉,要么被转移到业务代码中。最重要的是,选择开源即选择无法掌握核心根技术代码,没有最终掌握权。

OceanBase坚持长期主义,选择完全自研之路,勇闯中国数据库“无人区”。技术创新的过程肯定会遇到各种艰难困阻,如果遇到一座山想绕过去,以后遇到更高的山只能止步。数据库自研关山难越,OceanBase 从头越。正如杨冰所说:“刚开始举步维艰,但当我们完成了支付宝核心系统替换,轻舟已过万重山。对代码完全的掌控力和掌控权也使OceanBase能够逢山开路遇水搭桥,厚积薄发。”
一路走来,凭借两套公式OceanBase走出不一样的成长路径:通过场景X资金X时间来打造核心技术,OceanBase从0到1完成商业化和产品化探索;坚持(自研+开放+创新)X长期主义,跨越深水区,从支付核心场景再到全场景金融、政企民生、运营商、新零售/新制造等核心场景发挥支撑作用,如今OceanBase 在千行百业的关键业务中深度完善产品迭代。据杨冰介绍,有70%千亿资产规模以上银行、75%头部证券机构、65%头部保险机构、45%头部基金公司都选择OceanBase进行核心系统升级。目前,OceanBase帮助1000多家行业客户实现数字化升级,涵盖金融、政务、能源、运营商、交通、互联网等海内外企业。

根据工信部赛迪顾问软件与信息服务产业研究中心发布的《2022-2023中国平台软件市场研究年度报告》,在对平台软件需求增长最快的金融行业里,OceanBase已占据国产分布式数据库市场占有率第一的位置。

践行一体化产品战略,让数据“从一而终”

在这些成绩背后,我们追溯其底层逻辑,发现从OceanBase的整体演进来看,一体化设计是其DNA,OceanBase始终践行一体化产品战略,用一体化架构解决分布式数据库使用复杂问题,用一体化产品满足80%的客户需求,持续打造承载关键业务负载的分布式数据库。可以说,一体化的理念从 OceanBase 架构设计的第一天起,就被视为自然而然的选择。“一体化”理念贯穿整个 OceanBase 发展历程,不断生根发芽,通过分布式架构底座将多个关键能力融合到一个数据库、一套架构、一份数据、一个技术栈、一个引擎。

从OceanBase的发展路径来看,在早期1.0版本已经实现工程一体化,并提供多租户以及资源隔离能力,可将更多的数据库实例整合一个集群中。多租户能力带来的是技术栈的统一,这能够极大简化数据库基础设施的复杂度。用户不用再关心资源隔离问题,进而提高系统利用率。

OceanBase 2.0版本拥有高度兼容性。通过一体化SQL引擎,能够同时兼容MySQL以及Oracle主流数据库,大量的自动迁移工具,也能支持迁移评估和反向同步以保障数据迁移安全,支撑金融、政府、运营商等关键业务系统升级。

OceanBase 3.0版本带来是数据一致性优势。通过加速进化多种工作负载能力,用户无须关心ETL的复杂性,一个系统、一份数据,就可以在高性能OLTP基础上获得实时分析能力。

2022年8月,OceanBase发布了业内首个单机分布式一体化数据库OceanBase 4.0。在这一版本中,OceanBase进一步在单机分布式一体化架构、多模型、多基础设施方面发力,有效兼顾了分布式架构的扩展性与集中式架构的性能优势,首次突破了分布式数据库的单机性能瓶颈,在同等硬件条件下实现单机性能赶超集中式数据库,帮助用户极大地降低了分布式数据库的使用门槛。

当然,OceanBase的进化并未结束。在此次发布会上,OceanBase进一步发布了一体化数据库的首个长期支持版本——OceanBase 4.2.1 LTS 版本。4.2.1 版本是面向 OLTP 核心场景的全功能里程碑版本,这标志一体化数据库迈入了可规模化上线使用的长期支持阶段。

一体化进化,让关键能力实现关键升级

在OceanBase一体化战略下,用户可以避免在不同的数据库之间奔波。但对于普通的使用者而言,好用、易用、性能强大才是他们核心关注的内容。

杨传辉表示,OceanBase 4.2.1 LTS是面向OLTP核心场景全功能的里程碑版本,具备OLTP的完整功能。纵向对比来看,OceanBase 4.2.1 LTS相比 3.2 版本有很大的性能提升,4C 小规格场景 Sysbench 综合读写性能相比 3.2 版本的 1.9倍,OLAP TPC-DS 100G 场景性能是 3.2版本的 2.7倍。相比传统容灾,4.2.1LTS版本拥有更具性价比的无损容灾解决方案,通过2个副本实现RPO=0。

横向对比性能来看,基于单机分布式一体化架构设计的4.2.1版本,每个节点都能提供无差别、可读可写的数据库服务,兼具单机数据库的高性能和分布式数据库无限水平扩展的能力。因此,在不同形态之下,都能提供优秀的性能支持。

在同等硬件条件下,OceanBase 4.2.1 LTS单机形态相比主流单机数据库提供更好的性能。经实际测试,在4C、8C、16C等中小规格的单机场景下sysbench 综合性能要高于MySQL 8.0,能够保障用户的使用体验;而在分布式形态下,实现了TPC-C和TPC-H的双料第一。在高并发场景下可按需实现不停机、不改应用的扩缩容及性能的线性增长。其中TPC-C 基准测试成绩为7.07 亿tpmC,TPC-H 基准测试核心性能的每小时执行请求数综合指标达到了1526 万QphH在30,000GB。两项成绩均验证了OceanBase 能够更快、更稳定地应对性能密集型的关键工作负载。

在成本方面来看,OceanBase 兼具分布式的扩展性和集中式数据库的功能和单机性能,能实现分布式架构下极致性能和最优成本的双重平衡。既可以借助单机分布式一体化、极致无损压缩在架构成本、存储成本带来显著的成本节约,又可以通过多租户、多兼容能力统一数据库基础设施数据栈,降低运维成本及管理成本。

如果从不同的形态来看,OceanBase在成本方面拥有的优势变得更加明显。在单机部署形态下,在同等硬件条件下,OceanBase的 SQL 及事务处理性能和 MySQL 相当,部分场景下存储成本可降低至原有的1/3;随着企业业务规模的增大,为提升性能往往需要升级硬件,相较于传统数据库的非线性成本增长,OceanBase的水平扩展可以做到真正的线性扩展,这使得成本也成线性增长,能够更好地帮助用户降低数据库成本;同时,OceanBase实现了单机和分布式架构的统一,能够兼容集中式数据库的行为和使用方式。基于此,用户可以在基本不修改业务代码的情况下,平滑地从单机形态扩容到分布式形态,而无须额外的迁移及学习成本。

OceanBase在成本方面的努力也得到业界的认可,国际咨询机构 Forrester 对 OceanBase 总体经济影响的调研报告显示,采用OceanBase后企业数据存储空间节约 70%,服务器资源节约 85%,平均每注册用户数据库成本节约 50%,且呈现逐渐成本节约递增的趋势。

独一但不无二,一体更能同心

看到这,有开发者朋友关心,既然OceanBase数据库能解决80%的问题,那么OceanBase的一体化进程是否意味未来有可能会取代其他数据库呢?这一点倒大可不必担心,尽管一体化数据库的发展是一种趋势,但绝非意味着各种不同领域的专业数据库就会消亡。

正如杨冰所说,尽管一体化数据库可以通过对不同场景的“求解公约数”找到相同问题,提供统一解决的办法,但在一些复杂场景下,专业版本的数据库仍会更有优势。

这就像今天我们普遍用智能手机欣赏音乐和视频,但电影院和专业的视频音响设备仍然有存在的价值,很多时候人们用智能手机玩游戏,但也有很多人喜欢游戏机等,不同的领域中有不同的体验,OceanBase 做到的“独一”并不排外,不会形成“无二”的局面。

当然,OceanBase的进化也不会停止。随着数字化转型进程的加速推进,越来越多的企业在典型的OLTP-based HTAP 场景中,迫切需要确保在高性能 OLTP 的基础上,获得更为迅速地实时分析能力。本次年度发布会,4.2.1 LTS版本便实现了众多用户期待的多模、超大事务、全功能DDL、租户级备库等内核关键能力,以及满足高可用的单机模式。同时,OceanBase 也在持续完善 MySQL 及 Oracle 兼容性,在新增内核兼容功能的同时还提供 MySQL Binlog 协议的支持,帮助用户更方便地把数据库接入到下游 MySQL 生态。

值得注意的是,OceanBase还将列存实验室版本带到了现场,与业内一流的大宽表列存数据库ClickHouse 现场跑分 PK ,在同等硬件条件下,OceanBase列存实验室版本性能达到 ClickHouse 同一水平。从公开的产品路线图来看,预计列存版本将于明年4.3版本正式发布。

一体化进程究竟意味着什么呢?对于一线开发和运维人员来讲,其意味着过往不断切换数据库的烦恼会消失不见;对于技术决策层而言,意味着不必为了不同的数据库运维、管理、更新而不断买单;而对于行业而言,这意味着一种新的选择,一种能够进一步推动数据库行业持续发展的选择,与更多的行业从业者同心协力,共同构建数据库良好生态。

继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存